Processus d'acquisition d'un dictionnaire de sigles et de leurs définitions à partir d'un corpus

نویسندگان

  • Vladislav Matviico
  • Nicolas Muret
  • Mathieu Roche
چکیده

De nombreux domaines comme la biologie ou la médecine voient naître chaque jour de nouveaux termes et abréviations, notamment des sigles. Un sigle est un ensemble de lettres initiales servant d’abréviation, par exemple "RATP" peut être associé à la définition (aussi appelée expansion) "Régie Autonome des Transports Parisiens". Nos travaux ont consisté à développer un logiciel afin de faciliter l’acquisition ou l’enrichissement de dictionnaires en extrayant automatiquement, à partir de diverses sources, les sigles et leur(s) définition(s). Une fois ces dictionnaires constitués, l’approche AcroDef que nous avons proposée dans (Roche et Prince (2007)) consiste à établir la définition pertinente d’un sigle présent dans un document. Dans ces documents, la définition n’est pas toujours présente d’où la difficulté du traitement. Dans ce contexte, il est donc essentiel d’avoir à disposition un dictionnaire adapté, ce qui justifie les travaux présentés dans cet article. De nombreuses méthodes pour extraire les sigles et leur(s) définition(s) ont été développées (Larkey et al. (2000); Okazaki et Ananiadou (2006)). La plupart des approches de détection de sigles dans les textes s’appuient sur l’utilisation de marqueurs spécifiques associés à des heuristiques adaptées. Certains travaux récents (Okazaki et Ananiadou (2006)) consistent à associer ces approches à des mesures statistiques spécifiques pour améliorer la qualité des méthodes d’acquisition de dictionnaires. L’approche que nous avons développée se compose de deux étapes successives qui sont détaillées dans la section 2.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Déploiement coopératif d'un dictionnaire électronique de données administratives

RÉSUMÉ. L’interprétation de l’information administrative est un processus complexe : en effet, la signification des concepts représentés est empirique et évolutive. Les incidences sociales de ce processus sont toutefois cruciales : ainsi, les montants traités via les bases de données de la sécurité sociale belge s’élèvent annuellement à environ 35 milliards d’euros. Cet article propose un ensem...

متن کامل

Extraction métaheuristique d'une architecture à base de composants à partir d'un système orienté objet

Résumé. La modélisation et la représentation des architectures logicielles sont devenues une des phases principales du processus de développement de systèmes complexes. En effet, la représentation de l’architecture fournit de nombreux avantages pendant tout le cycle de vie du logiciel. Cependant pour beaucoup de systèmes existants, aucune représentation fiable de leurs architectures n’est dispo...

متن کامل

Modélisation et extraction de données pour un entrepôt objet

Résumé : Cet article traite de la modélisation orientée objet pour la conception d'un entrepôt de données complexes et historisées (conservation des évolutions). Un des aspects majeurs de cette modélisation est l'extension du concept de classe par celui de classe entrepôt, défini au travers d'un filtre temporel et d'un filtre d'archives ainsi que d'une fonction de construction. Les filtres gère...

متن کامل

Extraction d'Architecture à Base de Composants d'un Système Orienté Objet

RÉSUMÉ. Disposer d’une représentation de l’architecture d’un système complexe est devenue essentiel pendant toutes les phases du cycle de vie du logiciel. Cependant pour beaucoup de systèmes, aucune représentation fiable de leurs architectures n’est disponible. Afin de palier cette absence, source de nombreuses difficultés, nous proposons, dans cet article une approche visant à extraire une arc...

متن کامل

Méthodologie Causal de Modélisation et de Commande: Application aux Machines Électriques

Résumé : La commande d'un processus se détermine classiquement à partir d'un modèle mathématique donné sous des formes diverses: équation différentielle, fonction de transfert, lieux de transfert, etc....Les approches classiques donnent des informations tant quantitatives que qualitatives sur les systèmes à modéliser. Dans le cas des systèmes complexes d'autres approches ont été développées pou...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008